Detección del engaño en notas de opinión a través de técnicas tradicionales de clasificación automática de textos

نویسندگان

  • Javier Sánchez-Junquera
  • Luis Villaseñor Pineda
  • Hugo Jair Escalante
  • Manuel Montes-y-Gómez
چکیده

This work studies the scope of traditional techniques used in automatic text classification (v. gr. bag of words) for the deceptive detection. Commonly, traditional techniques work well in thematic classification. However, it is desired to know the performance of these techniques in an intuitively non-thematic task. The collection used is a set of English notes of hotel reviews, including truthful and deceptive notes. Experiments were performed using bag of words with binary weighing schemes, tf and tf-idf and training a probabilistic classifier. The results show that deception can be detected with the traditional approach. A first analysis of these results identifies those elements on which discrimination fell.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Detección de subjetividad en noticias en línea publicadas en español utilizando clasificadores probabilísticos

Resumen. Los textos periodísticos pueden clasificarse dentro del llamado género informativo si su contenido se orienta a la objetividad (descripción de los hechos ocurridos), o en el género de opinión, si incluye elementos subjetivos (como el punto de vista o ideología del autor de la nota). Uno de los problemas que se presenta en la redacción de noticias es que en las notas de tipo informativo...

متن کامل

Detección de perfiles de usuarios en la Web 2.0 desde el punto de vista emocional

Actualmente, los estudios sociológicos sobre los estados ańımicos se realizan a través de la interpretación de encuestas individuales en las que se formulan preguntas acerca del estado emocional y del bienestar del encuestado. Sin embargo, es bien conocido que el proceso podŕıa dar con interpretaciones erróneas. Es por ello, que el objetivo principal del proyecto de tesis es la creación de técn...

متن کامل

Efecto del pre-procesamiento en la detección automática de plagio para PAN 2014 y PAN 2015

Resumen. Dentro de la detección automática de plagio, el alineamiento de texto en [1] lo define como el descubrimiento de fragmentos similares de texto entre dos documentos. La cual puede utilizarse en: detección de plagio, identificación de autoría, detección de reúso de texto, recuperación de información, entre muchas otras. El pre-procesamiento consta de diversas técnicas que se aplica en la...

متن کامل

Desarrollo de un sistema para medir similitud entre clases

Resumen. El incremento continuo de información en formato digital obliga a contar con nuevos métodos y técnicas para acceder, recopilar y organizar estos volúmenes de información textual. Una de las técnicas más utilizadas para organizar dicha información es la clasificación de documentos. Los sistemas de clasificación automática de textos tienen una baja eficiencia cuando las clases son muy pa...

متن کامل

Herramienta de apoyo en la detección de reutilización de código fuente

Resumen. El acto de tomar parcial o totalmente contenidos generados por otras personas, y presentarlos como propios, sin dar el crédito correspondiente a los autores, es una forma indebida de reutilización de contenidos, considerada como plagio. Desafortunamente, en la actualidad, dada la amplia disponibilidad de contenidos a través de Internet, esta práctica se ha incrementado. La gran mayoŕıa...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Research in Computing Science

دوره 134  شماره 

صفحات  -

تاریخ انتشار 2017